
12 Introducción al manejo de datos geoespaciales con R
12.1 Resumen
El lenguaje de programación R cuenta con una gran variedad de paquetes para manejo de datos geoespaciales, entre los que están el paquete sf para datos vectoriales, el paquete terra para datos raster y el paquete leaflet para mapas en la Web.
12.2 Trabajo previo
12.2.1 Lecturas
Lovelace, R., Nowosad, J., & Münchow, J. (2019). Geocomputation with R (capítulos 1 y 2). CRC Press. https://geocompr.robinlovelace.net/
12.3 Introducción
La comunidad de programadores de R ha desarrollado un conjunto de paquetes para el manejo de datos geoespaciales, tanto en formatos vectoriales como raster. Algunos de los principales de estos paquetes son:
El paquete sf. Ofrece un conjunto de funciones para el manejo de datos vectoriales, de acuerdo con el estándar Simple Features.
El paquete terra. Implementa un conjunto de funciones para el manejo de datos raster. Es una reimplementación del paquete raster.
El paquete leaflet. Es una implementación en R de la biblioteca Leaflet para el lenguaje JavaScript para la programación de mapas interactivos en páginas web.
Algunos paquetes de graficación estadística, como ggplot2 y plotly, también cuentan con capacidades para visualización de datos geoespaciales.
En CRAN Task View: Analysis of Spatial Data, puede encontrarse un resumen detallado de los paquetes de R con funciones geoespaciales.
12.4 Datos vectoriales
12.4.1 El modelo vectorial
El modelo vectorial de datos está basado en puntos localizados en un sistema de referencia de coordenadas (CRS). Los puntos individuales pueden representar objetos independientes (ej. postes eléctricos, cabinas telefónicas) o pueden también agruparse para formar geometrías más complejas como líneas (ej. ríos, caminos) o polígonos (ej. fincas, países, provincias). Por lo general, los puntos tienen solo dos dimensiones (x, y), a las que se les puede agregar una tercera dimensión z, usualmente correspondiente a la altitud sobre el nivel del mar.
12.4.2 El estándar Simple Features
Simple Features (o Simple Feature Access) es un estándar abierto de la Organización Internacional de Estandarización (ISO) y del Open Geospatial Consortium (OGC) que especifica un modelo común de almacenamiento y acceso para geometrías de dos dimensiones (líneas, polígonos, multilíneas, multipolígonos, etc.). El estándar es implementado por muchas bibliotecas y bases de datos geoespaciales como sf, Fiona, GDAL, PostgreSQL/PostGIS, SQLite/SpatiaLite, Oracle Spatial y Microsoft SQL Server, entre muchas otras.
La especificación define 17 tipos de geometrías, de las cuales siete son las más comúnmente utilizadas. Estas últimas se muestran en la Figura 12.1.
12.4.3 El paquete sf
El paquete sf (de Simple Features) de R implementa los modelos de datos de las geometrías de tipo vectorial: puntos, líneas, polígonos, sus versiones múltiples y las colecciones de geometrías. Está basado en bibliotecas de sofware ampliamente utilizadas en aplicaciones geoespaciales:
- Geospatial Data Abstraction Library (GDAL): es una biblioteca para leer y escribir datos geoespaciales en varios formatos raster y vectoriales. Implementa un único modelo abstracto de datos raster y un único modelo abstracto de datos vectoriales, lo que permite programar aplicaciones geoespaciales sin tener que ocuparse de las particularidades de cada formato que se utilice (GeoTIFF, NetCDF, ESRI Shapefile, GeoJSON, etc.). A pesar de que GDAL está programada en C/C++, cuenta con una interfaz de programación de aplicaciones (API) para varios lenguajes de programación, incluyendo C, C++, Python y Java. Además, ofrece un conjunto de utilitarios de línea de comandos cuyas distribuciones binarias están disponibles para varios sistemas operativos, incluyendo Windows, macOS y Linux.
- Geometry Engine, Open Source (GEOS): es una implementación en C++ de la biblioteca JTS Topology Suite (desarrollada en Java) y que implementa un conjunto de operaciones y predicados geoespaciales (ej. unión, intersección, distancia, área).
- PROJ: es una biblioteca que transforma coordenadas entre diferentes CRS, incluyendo tanto proyecciones cartográficas como transformaciones geodésicas.
sf provee acceso, desde un mismo paquete de R, a la funcionalidad de estas tres bibliotecas, proporcionando así una interfaz unificada para leer y escribir datos geoespaciales mediante GDAL, realizar operaciones con geometrías mediante GEOS y efectuar transformaciones entre sistemas de coordenadas mediante PROJ.
En sf, los conjuntos de datos geoespaciales se almacenan en objetos de una clase también llamada sf, los cuales son data frames que contiene una columna especial para las geometrías. Esta columna se denomina generalmente geom o geometry (aunque pueden tener cualquier otro nombre). El manejo de datos geoespaciales como data frames permite manipularlos con las funciones ya desarrolladas para este tipo de datos y con la misma forma de referenciar las filas (observaciones) y las columnas (variables).
12.4.3.1 Instalación y carga
# Instalación de sf
install.packages("sf")# Carga de sf
library(sf)12.4.3.2 Métodos
La lista de métodos (i.e. funciones) de la clase sf puede obtenerse a través de la función methods():
# Métodos de la clase sf
methods(class = "sf") [1] [ [[<- $<-
[4] aggregate as.data.frame cbind
[7] coerce dbDataType dbWriteTable
[10] filter identify initialize
[13] merge plot print
[16] rbind show slotsFromS3
[19] st_agr st_agr<- st_area
[22] st_as_s2 st_as_sf st_as_sfc
[25] st_bbox st_boundary st_buffer
[28] st_cast st_centroid st_collection_extract
[31] st_convex_hull st_coordinates st_crop
[34] st_crs st_crs<- st_difference
[37] st_filter st_geometry st_geometry<-
[40] st_inscribed_circle st_interpolate_aw st_intersection
[43] st_intersects st_is_valid st_is
[46] st_join st_line_merge st_m_range
[49] st_make_valid st_nearest_points st_node
[52] st_normalize st_point_on_surface st_polygonize
[55] st_precision st_reverse st_sample
[58] st_segmentize st_set_precision st_shift_longitude
[61] st_simplify st_snap st_sym_difference
[64] st_transform st_triangulate st_union
[67] st_voronoi st_wrap_dateline st_write
[70] st_z_range st_zm transform
see '?methods' for accessing help and source code
Seguidamente, se describen y ejemplifican algunos de los métodos básicos de la clase sf.
12.4.3.2.1 st_read() - lectura de datos
El método st_read() lee datos vectoriales de una fuente en formato geoespacial (ej. shapefiles, archivos GeoJSON, bases de datos geoespaciales) y los recupera en un objeto sf.
En el siguiente bloque de código en R, se utiliza el método st_read() para leer un archivo GeoJSON con los polígonos de las provincias de Costa Rica. Este archivo proviene de un geoservicio de tipo Web Feature Service (WFS) publicado por el Instituto Geográfico Nacional (IGN).
# Lectura de una capa vectorial (GeoJSON) de provincias de Costa Rica
provincias <-
st_read(
"https://raw.githubusercontent.com/gf0604-procesamientodatosgeograficos/2023-i/main/datos/ign/delimitacion-territorial-administrativa/provincias.geojson",
quiet = TRUE # para evitar el despliegue de mensajes
)st_read() también puede crear objetos sf a partir de archivos de texto. Esta variante se utiliza principalmente cuando el archivo contiene coordenadas correspondientes a geometrías de puntos.
En el siguiente bloque de código, se utiliza st_read() para leer un archivo CSV con registros de presencia de felinos de Costa Rica, el cual contiene dos columnas llamadas decimalLongitude y decimalLatitude correspondientes a la longitud decimal y latitud decimal en las que fue observado cada felino. Este archivo proviene de una consulta al portal de datos de la Infraestructura Mundial de Información en Biodiversidad (GBIF).
# Lectura de un archivo CSV con registros de presencia de felinos en Costa Rica
felinos <-
st_read(
"https://raw.githubusercontent.com/gf0604-procesamientodatosgeograficos/2023-i/main/datos/gbif/felinos.csv",
options = c(
"X_POSSIBLE_NAMES=decimalLongitude", # columna de longitud decimal
"Y_POSSIBLE_NAMES=decimalLatitude" # columna de latitud decimal
),
quiet = TRUE
)Tanto provincias como felinos son objetos de la clase sf (y además de data.frame).
# Clase del objeto provincias
class(provincias)[1] "sf" "data.frame"
# Clase del objeto felinos
class(felinos)[1] "sf" "data.frame"
Al escribirse el nombre de un objeto sf en la consola de R, se despliega información general sobre este.
# Información general sobre el objeto provincias
provinciasSimple feature collection with 7 features and 6 fields
Geometry type: MULTIPOLYGON
Dimension: XY
Bounding box: xmin: 156152 ymin: 608833.8 xmax: 658879.5 ymax: 1241118
Projected CRS: CR05 / CRTM05
cod_catalo cod_provin provincia
1 160103 6 Puntarenas
2 160103 1 San José
3 160103 7 Limón
4 160103 3 Cartago
5 160103 2 Alajuela
6 160103 5 Guanacaste
7 160103 4 Heredia
ori_toponi
1 En documento de 1720, se menciona la llegada del pirata Chipperton a la zona, en el cual aparece la descripcíon referente a una embarcación pequeña en la Punta de Arena, adoptando con el tiempo el nombre de Puntarenas
2 Se remonta a la creación de la ermita dedicada al Patriarca San José en 1737
3 El origen del nombre de la provincia se remonta a 1852, cuando por primera vez se cita en un documento oficial el puerto de Limón
4 Don Juan Vázques de Coronado escogió el sitio en el valle del Guarco para trasladar a la ciudad de Garcimuños, en 1563, bautizando al nuevo asentamiento con el nombre de Cartago
5 Se remonta al paraje llamado La Lajuela que por primera vez se cita en los Protocolos de Cartago de 1657
6 En alegoria a un frondoso árbol de Guanacaste ubicado en la intersección de los caminos que se dirigían a Nicoya, Bagaces y Rivas, en lo que hoy día es el parque de Liberia. Esta referencia data del siglo XVIII
7 En correspondiencia al Presidente de la Real Audiencia de Guatemala, Capitán General don Alonso Fernández de Heredia, de la Inmaculada Concepción de Cubujuquí a Villa de Heredia
area version geometry
1 11298.51 20201222 MULTIPOLYGON (((159917.7 60...
2 4969.73 20201222 MULTIPOLYGON (((505765.3 11...
3 9176.96 20201222 MULTIPOLYGON (((532516.6 12...
4 3093.23 20201222 MULTIPOLYGON (((556146.1 10...
5 9772.27 20201222 MULTIPOLYGON (((427195 1224...
6 10196.32 20201222 MULTIPOLYGON (((380807.3 11...
7 2663.46 20201222 MULTIPOLYGON (((497345.1 11...
12.4.3.2.2 st_crs() y st_transform() - manejo de sistemas de coordenadas
El método st_crs() retorna el CRS de un objeto sf.
# Despliegue del CRS del objeto provincias
st_crs(provincias)Coordinate Reference System:
User input: CR05 / CRTM05
wkt:
PROJCRS["CR05 / CRTM05",
BASEGEOGCRS["CR05",
DATUM["Costa Rica 2005",
ELLIPSOID["WGS 84",6378137,298.257223563,
LENGTHUNIT["metre",1]]],
PRIMEM["Greenwich",0,
ANGLEUNIT["degree",0.0174532925199433]],
ID["EPSG",5365]],
CONVERSION["Costa Rica TM 2005",
METHOD["Transverse Mercator",
ID["EPSG",9807]],
PARAMETER["Latitude of natural origin",0,
ANGLEUNIT["degree",0.0174532925199433],
ID["EPSG",8801]],
PARAMETER["Longitude of natural origin",-84,
ANGLEUNIT["degree",0.0174532925199433],
ID["EPSG",8802]],
PARAMETER["Scale factor at natural origin",0.9999,
SCALEUNIT["unity",1],
ID["EPSG",8805]],
PARAMETER["False easting",500000,
LENGTHUNIT["metre",1],
ID["EPSG",8806]],
PARAMETER["False northing",0,
LENGTHUNIT["metre",1],
ID["EPSG",8807]]],
CS[Cartesian,2],
AXIS["northing (N)",north,
ORDER[1],
LENGTHUNIT["metre",1]],
AXIS["easting (E)",east,
ORDER[2],
LENGTHUNIT["metre",1]],
USAGE[
SCOPE["Cadastre, engineering survey, topographic mapping (large and medium scale)."],
AREA["Costa Rica - onshore and offshore east of 86°30'W."],
BBOX[2.21,-86.5,11.77,-81.43]],
ID["EPSG",5367]]
# Despliegue CRS del objeto felinos
st_crs(felinos)Coordinate Reference System: NA
st_crs() también puede asignar un CRS a un objeto sf que no lo tiene.
# Asignación de un CRS al objeto felinos
st_crs(felinos) <- 4326El método st_transform() transforma un objeto sf a un nuevo CRS.
# Transformación del CRS del objeto provincias a WGS84 (EPSG = 4326)
provincias <-
provincias |>
st_transform(4326)12.4.3.2.3 plot() - mapeo
El método plot() grafica objetos sf en un mapa.
# Mapeo de las geometrías del objeto provincias
plot(provincias$geometry)
# Mapeo con argumentos adicionales de plot()
plot(
provincias$geometry,
extent = st_bbox(c(xmin = -86.0, xmax = -82.3, ymin = 8.0, ymax = 11.3)),
main = "Provincias de Costa Rica",
axes = TRUE,
graticule = TRUE
)
Los argumentos reset y add de plot() permiten generar un mapa con varias capas.
# Primera capa del mapa
plot(
provincias$geometry,
extent = st_bbox(c(xmin = -86.0, xmax = -82.3, ymin = 8.0, ymax = 11.3)),
main = "Registros de presencia de felinos en Costa Rica",
axes = TRUE,
graticule = TRUE,
reset = FALSE
)
# Segunda capa
plot(felinos$geometry,
add = TRUE,
pch = 16,
col = "blue")
Para conocer los valores del argumento pch, puede consultar R plot pch symbols.
12.4.3.2.4 st_write() - escritura de datos
El método st_write() guarda en el disco un objeto sf en los diferentes formatos vectoriales de GDAL.
# Especificación del directorio de trabajo (debe utilizarse una ruta existente)
setwd("/home/mfvargas")
# Escritura del objeto provincias en formato GPKG
provincias |>
st_write("provincias.gpkg")
# Escritura del objeto felinos en formato KML
felinos |>
st_write("felinos.kml")12.4.3.2.5 Otros
# Cantidad de filas de un objeto sf
nrow(provincias)[1] 7
# Cantidad de columnas de un objeto sf
ncol(provincias)[1] 7
# Resumen de la columna de geometría
summary(provincias$geometry) MULTIPOLYGON epsg:4326 +proj=long...
7 0 0
12.4.4 Mapeo de objetos sf con otros paquetes
12.4.4.1 leaflet
El paquete leaflet genera mapas interactivos en lenguaje de marcado de hipertexto (HTML), el lenguaje de marcado utilizado para desarrollar páginas web.
12.4.4.1.1 Instalación y carga
# Instalación de leaflet
install.packages("leaflet")
# Instalación de leaflet.extras (funciones adicionales de leaflet)
install.packages("leaflet.extras")
# Instalación de leaflem (funciones adicionales de leaflet)
install.packages("leafem")# Carga de leaflet
library(leaflet)
# Carga de leaflet.extras
library(leaflet.extras)
# Carga de leafem
library(leafem)El siguiente bloque de código muestra las capas de provincias (polígonos) y de registros de presencia de felinos (puntos) sobre una capa base de OpenStreetMap (OSM) y otra de ESRI.
# Mapa leaflet básico de provincias y registros de presencia de felinos
leaflet() |>
setView(# centro y nivel inicial de acercamiento
lng = -84.19452,
lat = 9.572735,
zoom = 7) |>
addTiles(group = "Mapa general (OpenStreetMap)") |>
addProviderTiles(
providers$Esri.WorldImagery,
group = "Imágenes satelitales (ESRI World Imagery)"
) |>
addPolygons(
# capa de provincias (polígonos)
data = provincias,
color = "black",
fillColor = "transparent",
stroke = TRUE,
weight = 1.0,
group = "Provincias"
) |>
addCircleMarkers(
# capa de registros de presencia (puntos)
data = felinos,
stroke = F,
radius = 4,
fillColor = 'blue',
fillOpacity = 1,
popup = paste(
paste0("<strong>Especie: </strong>", felinos$species),
paste0("<strong>Localidad: </strong>", felinos$locality),
paste0("<strong>Fecha: </strong>", felinos$eventDate),
paste0("<strong>Fuente: </strong>", felinos$institutionCode),
paste0("<a href='", felinos$occurrenceID, "'>Más información</a>"),
sep = '<br/>'
),
group = "Felinos"
) |>
addLayersControl(
baseGroups = c(
"Mapa general (OpenStreetMap)",
"Imágenes satelitales (ESRI World Imagery)"
),
overlayGroups = c("Provincias", "Felinos")) |> # control de capas
addResetMapButton() |> # botón de reinicio
addSearchOSM() |> # búsqueda en OSM
addMouseCoordinates() |> # coordenadas del puntero del ratón
addScaleBar(
position = "bottomleft",
options = scaleBarOptions(imperial = FALSE)
) |> # barra de escala
addMiniMap(position = "bottomright") |> # mapa de ubicación
addFullscreenControl() # mapa de pantalla completa